約 4,230,959 件
https://w.atwiki.jp/kubo/pages/30.html
・文字コード
https://w.atwiki.jp/anuban/pages/34.html
文字コード - Wikipedia charset=TIS-620 charset=windows-874
https://w.atwiki.jp/ffbin/pages/8.html
文字コード 0 1 2 3 4 5 6 7 8 9 A B C D E F 0 〓 〓 〓 ず ぺ デ 盾 投 0 き ぬ ら ゛ キ ヌ ラ 1 \n 〓 〓 ぜ ぽ ド 鎧 手 1 く ね り ゜ ク ネ リ 2 〓 〓 〓 ぞ ヴ バ 兜 ◎ 2 け の る ー ケ ノ ル 3 〓 〓 〓 だ ガ ビ 腕 × 3 こ は れ ・・ コ ハ レ 4 〓 〓 〓 ぢ ギ ブ 爪 ○ 4 さ ひ ろ ! サ ヒ ロ 5 〓 〓 〓 づ グ ベ 本 ● 5 し ふ わ ? シ フ ワ 6 〓 〓 〓 で ゲ ボ 杖 E 6 す へ ん % ス ヘ ン 7 〓 〓 〓 ど ゴ パ 槌 H 7 せ ほ ァ / セ ホ ┏ 8 〓 〓 〓 ば ザ ピ 槍 M 8 そ ま ィ : ソ マ ━ 9 〓 〓 が び ジ プ 短 P 9 た み ゥ 『 タ ミ ┓ A 〓 〓 ぎ ぶ ズ ペ 斧 X あ ち む ェ ア チ ム ┃ B 〓 〓 ぐ べ ゼ ポ 剣 を い つ め ォ イ ツ メ ┃ C 〓 〓 げ ぼ ゾ C 刀 っ う て も ッ ウ テ モ ┗ D 〓 〓 ご ぱ ダ G 琴 ゃ え と や ャ エ ト ヤ ━ E 〓 〓 ざ ぴ ヂ L 弓 ゅ お な ゆ ュ オ ナ ユ ┛ F 〓 〓 じ ぷ ヅ V 鈴 ょ か に よ ョ カ ニ ヨ 〓 漢字表記はマークを表し、◎は灰色の丸を表す。 表のみかたは、「ず」は「x30」、「じ」は「x2F」のようによんでください。
https://w.atwiki.jp/freetool/pages/33.html
文字コードの変換・解析 HTMLソース日本語文字コードのオンライン変換 入力、出力HTMLのソースコードは Shift-JIS EUC-JP JIS(ISO-2022-JP) UTF-8 UTF-16 が可能です 「指定URL」か「ローカルHTMLファイル」のいずれかを指定して下さい。 文字コードの解析、変換(エンコード、デコード) 文字コードの変換や解析を行います。 文字化けを起こしたメッセージを読みたいときなどに効果があります。 TransEscape テキストエリアに文字列を入力してから、変換を押すと、下段のテキストエリアに escape エンコードされた文字列が出力されます。 Proxomitron用 文字コード変換 入力された文字列を「Proxomitron特有のエンコードされた文字列」に エンコード/デコード します。 Proxomitronはマルチバイト文字を認識しませんので、日本語にマッチさせるためにはエンコードする必要があります。
https://w.atwiki.jp/sakurawmemo/pages/15.html
エディタの内部コードはUTF-16です。サロゲートペアにはたいだい対応しています。 編集画面 サロゲートペアには対応しています。 2000, XP で、一部の言語の表示がおかしい場合、FontLinkの設定(レジストリ操作)が必要です。 プロポーショナルフォントには未対応です。 右書き(rtl)・合成文字・Unicode制御文字などには未対応です。 ファイルの読み込み Shift_JIS(CP932), EUC-JP 仕様によりNEC/IBM拡張漢字一部文字が双方向変換できないため、それらの文字が発見されると読み取り専用になります。 EUC-JPは、CP932に一度変換されてから、OSのコンバータでUTF-16LEに変換されます。 UTF-8 不正シーケンスは、U+D800からU+D8FFのサロゲート断片に変換されます。 CEUS-8 おそらくUTF-8に同じ。ただし、サロゲートペアは、CEUSの規則に従って変換されます。 UTF-16LE/UTF-16BE ファイルが奇数バイトの場合は、最後の文字の上位8bitに0を割り当てて、偶数バイトにするらしい IS-2022-JP 未調査 UTF-7 未調査 ファイルの書き出し Shift_JIS(CP932), EUC-JP 表現不能なワイド文字がある場合、?に変換されるらしい EUC-JPは、CP932に一度変換されてから、OSのコンバータでUTF-16LEに変換されます。 UTF-8 U+D800からU+D8FFのサロゲート断片は、元のバイトシーケンスに変換されます。 CEUS-8 UTF-8に同じ UTF-16LE/UTF-16BE ファイルが奇数バイトだったときでも、読み込み時の影響で偶数バイトになるらしい IS-2022-JP 未調査 UTF-7 未調査 不正データ類の保持 サクラ上のU+D800からU+D8FFのサロゲート断片は ?XX と表示され半角扱いになります。 正常なサロゲートペアはそれなりに扱います。(並び順依存) コードポイント表示 [共通設定]に、エンコードごとにステータスに表示されるコードポイントの指定オプションがあります。 デフォルトエンコード指定 [タイプ別設定]-[支援]に、タイプ別ごとのデフォルト指定があります。 ※Grepも、そのウィンドウに適用されているタイプ別設定に依存して文字コード判別をします。 関連 エンコーダー/デコーダー周りについて Rev 1553 PatchUnicode 2478365
https://w.atwiki.jp/mmbndata/pages/21.html
文字コード表 00 01 02 03 04 05 06 07 08 09 0A 0B 0C 0D 0E 0F 00 0 1 2 3 4 5 6 7 8 9 ウ ア イ オ エ 10 ケ コ カ ク キ セ サ ソ シ ス テ ト ツ タ チ ネ 20 ノ ヌ ナ ニ ヒ ヘ ホ ハ フ ミ マ メ ム モ ヤ ヨ 30 ユ ロ ル リ レ ラ ン 熱 斗 ワ ヲ ギ ガ ゲ ゴ グ 40 ゾ ジ ゼ ズ ザ デ ド ヅ ダ ヂ ベ ビ ボ バ ブ ピ 50 パ ペ プ ポ ゥ ァ ィ ォ ェ ュ ヴ ッ ョ ャ A B 60 C D E F G H I J K L M N O P Q R 70 S T U V W X Y Z * - × = : % ? + 80 ■ コウモリ ー ! RV BX 、 。 . ・ ; " ~ / 90 ( ) 「 」 EX SP FZ □ _ z 周 え お う あ い A0 け く き こ か せ そ す さ し つ と て た ち ね B0 の な ぬ に へ ふ ほ は ひ め む み も ま ゆ よ C0 や る ら り ろ れ 究 ん を わ 研 げ ぐ ご が ぎ D0 ぜ ず じ ぞ ざ で ど づ だ ぢ べ ば び ぼ ぶ ぽ E0 ぷ ぴ ぺ ぱ F0 2バイト文字 E4 00 01 02 03 04 05 06 07 08 09 0A 0B 0C 0D 0E 0F 00 ぅ ぁ ぃ ぉ ぇ ゅ ょ っ ゃ a b c d e f g 10 h i j k l m n o p q r s t u v w 20 x y z 容 量 全 木 MB 無 現 実 ○ × 緑 道 不 30 止 彩 起 父 集 院 一 二 三 四 五 六 七 八 陽 十 40 百 千 万 脳 上 下 左 右 手 来 日 目 月 獣 各 人 50 入 出 山 口 光 電 気 綾 科 次 名 前 学 校 省 祐 60 室 世 界 高 朗 枚 野 悪 路 闇 大 小 中 自 分 間 70 系 鼻 問 究 門 城 王 兄 化 葉 行 街 屋 水 見 終 80 新 桜 先 生 長 今 了 点 井 子 言 太 属 風 会 性 90 持 時 勝 赤 毎 年 火 改 計 画 職 体 波 回 外 地 A0 員 正 造 値 合 戦 川 秋 原 町 晴 用 金 郎 作 数 B0 方 社 攻 撃 力 同 武 何 発 少 教 以 白 早 暮 面 C0 組 後 文 字 本 階 明 才 者 向 犬 々 ヶ 連 射 舟 D0 戸 切 土 炎 伊 夫 鉄 国 男 天 老 師 E0 F0
https://w.atwiki.jp/wiki6_takt/pages/9.html
Eclipse Eclipse起動オプション Eclipse.exe -VM c \java\javaw.exe -VMargs -Vms256M -Vmx512M -VM JVMの指定 -VMargs JVMへの引数 [-Vms 最小HeapSize][-Vmx 最大HeapSize] 文字化け WebSphereなどのIBM製品を使用し、Windows環境で作成した「shift_jis」文字CODEと 「euc」や「iso2022-jp」文字CODEのテキストとの相互変換を行い文字化けをする時があるようで対象となる文字は・・ 「∥」二重縦線 「~」波線 「-」記号(マイナス) 「¢」記号(セント) 「£」記号(ポンド) 「¬」記号(ノット) 理由は、Windows環境で作成した「shift_jis」の文字CODEが、 「MS932」文字CODEとして保存される為。 □補足 「MS932」文字CODEとはMicroSoft社が定義をした文字CODE。 上記の6文字の文字CODEが「shift_jis」と異なる。 他に"①"などの機種依存文字も含む文字CODE。 「shift_jis」, 「euc-jp」, 「iso2022-jp」は, 「JIS X 0208」として定義されている。 各文字コード一覧 MS932 SJIS EUC-JP ISO-2022-JP ~ 0xFF5E 0x301C 0x301C 0x301C ∥ 0x2225 0x2016 0x2016 0x2016 - 0xFF0D 0x2212 0x2212 0x2212 ¢ 0xFFE0 0x00A2 0x00A2 0x00A2 £ 0xFFE1 0x00A3 0x00A3 0x00A3 ¬ 0xFFE2 0x00AC 0x00AC 0x00AC □文字化けの原因 IBM製品で取り扱う文字コードの種類は 「MS932」「shift_jis」「euc-jp」「iso2022-jp」と4種類あり(utf-8とutf-16は除く)、 「shift_jis」「euc-jp」「iso2022-jp」の3種類の中で相互に文字CODEの変換を行う分には文字化けはしないが、「MS932」との変換を行うと文字化けする。 つまり MS932←→shift_jis MS932←→euc-jp MS932←→iso2022-jp は、文字化けする。 shift_jis←→shift_jis/euc-jp/iso2022-jp euc-jp←→shift_jis/euc-jp/iso2022-jp iso2022-jp←→shift_jis/euc-jp/iso2022-jp は、文字化けしない。 □ASTERIAの各バージョンによる文字コードの取り扱い ASTERIA R2で使用する文字コードは以下のようになります。 "shift_jis"→MS932文字コードとして取り扱いをします。 "SJIS"→shift_jis文字コードとして取り扱いをします。 "euc-jp"→euc-jp文字コードとして取り扱いをします。 "iso2022-jp"→iso2022-jp文字コードとして取り扱いをします。 注)Windows環境で作成したテキストは"shift_jis"と指定するだけで読み込みが可能です。 ASTERIA 3で使用する文字コードは以下のようになります。 "shift_jis"→shift_jis文字コードとして取り扱いをします。 "Windows-31J"→MS932文字コードとして取り扱いをします。 "euc-jp"→euc-jp文字コードとして取り扱いをします。 "iso2022-jp"→iso2022-jp文字コードとして取り扱いをします。 注)Windows環境で作成したテキストは明示的に"Windows-31J"と指定することで読み込みが可能です。 "shift_jis"の指定の場合には上記文字コードの場合には文字化けをします。 ASTERIA R2とASTERIA3で指定方法が異なるのは、ASTERIAが使用しているJava環境のバージョンの違いによるものです。 □文字化けの解消 ASTERIAでMS932とshift_jis, euc-jp, iso2022-jpの相互に文字コードを変換する場合には、 別途提供しておりますJava関数を使用することで文字化けを解消することができます。 例) MS932文字コード ↓ Java関数(A) ↓ shift_jis euc-jp iso2022-jp shift_jis euc-jp iso2022-jp ↓ Java関数(B) ↓ MS932文字コード Java関数(A) MS932文字コードのテキストをASTERIAのString型に読み込むときにJIS X 0208として変換を行います。 この変換によりString型からshift_jis, euc-jp, iso2022-jpへの相互変換においての文字化けが解消いたします。 # #String s = in[0].strValue(); #int len = s.length(); #StringBuffer buf =new StringBuffer(len); #for (int i=0; i len; i++) { # char c = s.charAt(i); # switch (c) { # case uFF5E c = u301C ; break; # case u2225 c = u2016 ; break; # case uFF0D c = u2212 ; break; # case uFFE0 c = u00A2 ; break; # case uFFE1 c = u00A3 ; break; # case uFFE2 c = u00AC ; break; # } # buf.append(c); #} #out.setValue(buf.toString()); # Java関数(B) JIS X 0208のテキストをASTERIAのString型からMS932として変換を行います。 この変換によりJIS X 0208(String型)からMS932への変換においての文字化けが解消いたします。 # #String s = in[0].strValue(); #int len = s.length(); #StringBuffer buf =new StringBuffer(len); # for (int i=0; i len; i++) { # char c = s.charAt(i); # switch (c) { # case u301C c = uFF5E ; break; # case u2016 c = u2225 ; break; # case u2212 c = uFF0D ; break; # case u00A2 c = uFFE0 ; break; # case u00A3 c = uFFE1 ; break; # case u00AC c = uFFE2 ; break; # } # buf.append(c); #} #out.setValue(buf.toString()); # Java関数(A)ではinputdata_AにはMS932文字コードを含む文字列が定義されていることを想定し、outputdata_AにはJIS X 0208に変換したテキストを出力します。 Java関数(B)ではinputdata_BにはJIS X 0208を含む文字列が定義されていることを想定し、outputdata_BにはMS932文字コードに変換したテキストを出力します。 注)これらの関数は文字数が増加するに従い条件判断の回数も増加するため、処理速度は文字数に比例してかかることとなります。
https://w.atwiki.jp/system-ed/pages/11.html
文字コード Ascii code アスキー, 情報交換用米国標準コード American Standard Code for Information Interchange の頭字語 アスキーコード(0x00~0x7F)と、JIS X 0201で規定されている半角カタカナを含む文字コード表です。(2013年6月13日 追記) 00 10 20 30 40 50 60 70 80 90 A0 B0 C0 D0 E0 F0 00 DE 0 @ P p ー タ ミ 01 SH D1 ! 1 A Q a q 。 ア チ ム 02 SX D2 ” 2 B R b r 「 イ ツ メ 03 EX D3 # 3 C S c s 」 ウ テ モ 04 ET D4 $ 4 D T d t 、 エ ト ヤ 05 EQ NK % 5 E U e u ・ オ ナ ユ 06 AK SN & 6 F V f v ヲ カ ニ ヨ 07 BL EB ’ 7 G W g w ァ キ ヌ ラ 08 BS CN ( 8 H X h x ィ ク ネ リ 09 HT EM ) 9 I Y i y ゥ ケ ノ ル 0A LF SB * : J Z j z ェ コ ハ レ 0B HM EC + ; K [ k { ォ サ ヒ ロ 0C CL → , < L ¥ l | ャ シ フ ワ 0D CR ← - = M ] m } ュ ス ヘ ン 0E SO ↑ . > N ^ n  ̄ ョ セ ホ ゛ 0F SI ↓ / ? O _ o ッ ソ マ ゜ 制御コード一覧 ㈱システム電子設計へ戻る
https://w.atwiki.jp/worktip/pages/13.html
iconvでの文字コード変換 iconvを使用した文字コード変換ではまったので注記 UTF-8 = Shift-JIS 文字コードをUTF-8とShift-JISで相互変換する場合に特定の文字が処理系で違うコードに変換されるようです。(ソフト依存??) その他の文字についてはまだ調べてないが、「-」(IMEでは[全]マイナスと表記)をWindows上でUTF-8として入力すると、EF BC 8D(EFBC8D)となる。 しかし、調べてみると、正しくはE2 88 92(E28892)らしく、iconvで「UTF-8- Shift-JIS- UTF-8」の変換を行うと「Shift-JIS- UTF-8」のところで不可逆な変換となりバグってしまう。 とりあえず、IMEからの入力は無理っぽかったので、iconvでE2 88 92のコードに変換してからコピペした。 ほかにもこんな文字があるのかなぁ。。。 名前 コメント
https://w.atwiki.jp/chapati4it/pages/143.html
サーブレットから直接CSVファイルをダウンロードするサンプルです。 配列の内容をCSV出力するだけの簡単なサンプルです。 お仕事では、データベースの検索キーなどをパラメータで受け取って、検索結果をCSV出力する事が多いと思います。 そんなサンプルもそのうち作ろうと思います。 日本語ファイル名対応はこちら → 日本語ファイル名対応のCSV出力サンプル ファイルの配置 /CONTEXT_ROOT ┣ WEB-INF ┃┣ src ┃┃┗ DynamicCsvServlet.java ┃┗ web.xml ┗ jsp ┗ dynamic_csv.jsp DynamicCsvServlet.java import java.io.*; import javax.servlet.*; import javax.servlet.http.*; public class DynamicCsvServlet extends HttpServlet { @Override protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { // POSTメソッドでアクセスが来てもGETメソッドで全部処理します。 doGet(req, resp); } @Override protected void doGet(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { // CSV出力用データ String[][] rows = { { "0", "ダイナミック", "dynamic@example.com" }, { "1", "ホゲ", "hoge@example.com" }, { "2", "モゲ", "moge@example.com" }, { "3", "マゲ", "mage@example.com" }, { "4", "フゥ", "foo@example.com" }, { "5", "バァ", "bar@example.com" }, { "6", "グゥ", "goo@example.com" } }; // 文字コード設定 resp.setContentType("text/html; charset=UTF-8"); // ファイル名設定(ファイル名を設定しないと、htmlとして画面に表示されてしまいます resp.setHeader("Content-Disposition", "attachment; filename=\"dynamic.csv\""); // CSVデータ作成 StringBuffer sb = new StringBuffer(); for (String[] row rows) { for (int i = 0; i row.length; i++) { if (i == 0) { sb.append("\""); } else { sb.append("\",\""); } sb.append(row[i]); if (i == row.length - 1) { sb.append("\"\n"); } } } // レスポンスにCSV出力 PrintWriter w = resp.getWriter(); w.print(sb.toString()); w.flush(); } } アクセスされると、ファイルではなくHttpServletResponseに直接CSVを出力するサーブレットです。 CSVダウンロードのために、文字コード、ファイル名を設定しています。 HttpServletResponseにファイル名とコンテンツ(CSV文字列)を与える事で、ブラウザはCSVファイルのダウンロードだと認識します。 // 文字コード設定 resp.setContentType("text/html; charset=UTF-8"); ここで、出力するCSVの文字コードを「UTF-8」に指定しています。 他の文字コードにする場合「UTF-8」の部分を修正します。 // ファイル名設定(ファイル名を設定しないと、htmlとして画面に表示されてしまいます resp.setHeader("Content-Disposition", "attachment; filename=\"dynamic.csv\""); ここで、ダウンロードするファイル名を設定しています。 ファイル名を設定しないと、ブラウザにhtmlとしてCSVの文字列が表示されてしまいます。 web.xml ?xml version="1.0" encoding="ISO-8859-1"? web-app xmlns="http //java.sun.com/xml/ns/javaee" xmlns xsi="http //www.w3.org/2001/XMLSchema-instance" xsi schemaLocation="http //java.sun.com/xml/ns/javaee http //java.sun.com/xml/ns/javaee/web-app_3_0.xsd" version="3.0" !-- サーブレットの宣言 -- servlet servlet-name dynamiccsvservlet /servlet-name servlet-class DynamicCsvServlet /servlet-class /servlet !-- サーブレットとurlのマッピング -- servlet-mapping servlet-name dynamiccsvservlet /servlet-name url-pattern /dynamiccsvservlet /url-pattern /servlet-mapping /web-app サーブレットの宣言とURLのマッピングです。 この時点で、Tomcatを起動して「http //localhost 8080/CONTEXT_ROOT/dynamiccsvservlet」にアクセスすると、CSVファイルのダウンロードダイアログが出てくると思います。 ※ブラウザの種類や設定によって動作が違います。 dynamic_csv.jsp %@ page language="java" contentType="text/html; charset=UTF8" pageEncoding="UTF-8" % html body 動的CSVダウンロード(GET): a href= %=request.getContextPath()+"/dynamiccsvservlet"% %=request.getContextPath()+"/csvservlet"% /a br form action= %=request.getContextPath()+"/dynamiccsvservlet"% method= GET input type="submit" value="動的CSVダウンロード(POST)" / /form /body /html 動的にCSVを出力するサーブレットへのリンクとフォームを表示するJSPです。 ブラウザに直接URL入力してもアクセス出来ますが、せっかくだからJSPも用意しました。 request.getContextPath() これは、Webアプリのコンテキストパスを出力してくれるメソッドです。 これに続けてサーブレットマッピングで指定したURLを記入すると、リンククリックやサブミットボタンでサーブレットにアクセス出来るのです。 ブラウザでアクセス 「http //localhost 8080/CONTEXT_ROOT/jsp/dynamic_csv.jsp」にアクセスすると、ダウンロードのリンクが表示されて、リンククリック、ボタンクリックでブラウザのダウンロード処理が動きます。 他のTomcatサンプルはこちら Tomcatサンプル Tomcatメモ Tomcat7.0.37のインストールとeclipseの設定(Windows) サーブレットを作ってみる Tomcat7のインストールとwarファイルのデプロイ(ubunts12.04) warファイルをdotcloudにデプロイ サーブレットからJSPに遷移するサンプル サーブレットからCSVファイルをダウンロードするサンプル サーブレットからCSVファイルをダウンロードするサンプル(日本語ファイル名) サーブレットからファイルをダウンロードするサンプル(日本語ファイル名) Basic認証(UserDatabaseRealm)+DIGEST認証 JFreeChartで動的にグラフを出力するサンプル ファイルをアップロードするサンプル(Commons FileUplaod) クロスサイトスクリプティング脆弱性を体験してみるサンプル コメント 345 - WEE 2015-07-24 14 31 32 WEE - 345 2017-09-07 18 23 17 名前